Traiter les documents XML avec les « contextes de lecture »

نویسنده

  • Xavier Tannier
چکیده

RÉSUMÉ. Le langage XML autorise, par sa souplesse de structuration, des manipulations du contenu qui créent parfois des ruptures arbitraires dans le flot naturel du texte. Ces caractéristiques soulèvent des difficultés lorsque l’on souhaite mettre en œuvre des techniques d’analyse automatique du contenu des documents XML. Cet article présente cette problématique et y répond, sur le plan théorique, avec l’introduction du concept de contexte de lecture, puis sur le plan pratique, avec une classification automatique des balises XML et la présentation d’un outil générique de gestion des contenus XML.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modèles et Architecture d'une Mémoire d'Annotation context-aware pour l'Enseignant

Résumé. Cet article décrit un modèle conceptuel et une architecture globale pour une mémoire d’annotation context-aware. Cette mémoire permet à l’enseignant de gérer les annotations qu’il créées sur ses documents pédagogiques et adapte son comportement aux différents contextes de l’activité de cet enseignant, lui offrant ainsi une grande utilisabilité tout en minimisant son effort (effortless)....

متن کامل

Treatment of Hemorrhoids

Le traitement des hemorroides peut-etre dif­feren: selon l'intens,ite et la frequence de leur manifestations.  1. Crise hemorroidaire avec douleur, hemor­ragie et parfois peUt procidence, a la suite d'un repas, fatigue, etc ... sans precedent, est traiter par des moyennes medicaux apropries. 2. Les vrais hemorroides doivent etre traite soit par des methodes Sclerosantes, soit par des meth...

متن کامل

Du XML au multidimensionnel : Conception de magasins de données

Résumé. Avec l’ouverture des entreprises sur l’Internet, les sources de données englobent davantage des données échangées avec les partenaires et/ou issues du Web. Dans ce cadre organisationnel ouvert, les documents XML constituent des sources de données plus utilisées aussi bien pour le stockage que pour les échanges transactionnels. Ce nouveau format de données a motivé des propositions de mo...

متن کامل

Correspondances de Galois pour la manipulation de contextes flous multi-valués

Résumé. L’analyse formelle de concepts est une méthode fondée sur la correspondance de Galois et qui permet de construire des hiérarchies de concepts formels à partir de tableaux de données binaires. Cependant de nombreux problèmes réels abordés en fouille de données comportent des données plus complexes. Afin de traiter de tels problèmes, nous proposons une conversion de données floues multi-v...

متن کامل

Interprétation vague des contraintes structurelles pour la RI dans des corpus de documents XML - Évaluation d'une méthode approchée de RI structurée

RÉSUMÉ. Nous proposons des algorithmes dédiés à l’indexation et à la recherche approximative d’information dans les bases de données hétérogènes semi-structurées XML. Le modèle d’indexation proposé est adapté à la recherche de contenu textuel dans les contextes XML définis par les structures d’arbres. Les mécanismes de recherche approchée mis en œuvre s’appuient sur une distance de Levenshtein ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • TAL

دوره 47  شماره 

صفحات  -

تاریخ انتشار 2006